草庐IT

xml - readHTMLTable 和 UTF-8 编码

全部标签

ruby-on-rails - 使用 Rails Assets 管道在 JavaScript 文件中编码问题

我正在使用Rails3.1和Assets管道(ruby1.9.2)。在尝试提供具有utf-8编码字符串的javascriptjs.erb文件时出现以下错误invalidbytesequenceinUS-ASCII我在我的environment.rb文件中设置了Encoding.default_external="UTF-8"。我如何让Assets管道以不同的编码提供服务?编辑仅当我在文件外部生成utf-8字符时才会出现该错误(在本例中是通过从数据库查询)。如果我添加,错误就会消失到文件的顶部。我猜这里会进行某种编码猜测,但如果没有那种骇人听闻的解决方案,我该如何避免呢?

Ruby:按字节长度限制 UTF-8 字符串

ThisRabbitMQpage状态:Queuenamesmaybeupto255bytesofUTF-8characters.在ruby​​(1.9.3)中,如何按字节数截断UTF-8字符串而不在字符中间中断?生成的字符串应该是符合字节限制的最长可能的有效UTF-8字符串。 最佳答案 对于Rails>=3.0,你有ActiveSupport::Multibyte::Chars限制方法。来自API文档:-(Object)limit(limit)将字符串的字节大小限制为字节数而不破坏字符。当由于某种原因字符串的存储空间有限时可用。例子

ruby-on-rails - Rails 3,导入前检查 CSV 文件编码

在我的应用程序(Rails3.0.5、Ruby1.8.7)中,我创建了一个导入工具来从文件导入CSV数据。问题:我要求我的用户以UTF-8编码从Excel中导出CSV文件,但大多数时候他们并没有这么做。如何在导入前验证文件是否为UTF-8?否则导入将运行但会产生奇怪的结果。我使用FasterCSV导入。错误的CSV文件示例:;VallÈeduRhÙne;CÙteRotie;谢谢。 最佳答案 您可以使用CharlockHolmes,Ruby的字符编码检测库。https://github.com/brianmario/charlock_

ruby - String#encode 未修复 "invalid byte sequence in UTF-8"错误

我知道有很多关于此错误的类似问题,而且我已经尝试了很多,但都没有成功。我遇到的问题涉及字节\xA1并且正在抛出ArgumentError:invalidbytesequenceinUTF-8我尝试了以下但没有成功:"\xA1".encode('UTF-8',:undef=>:replace,:invalid=>:replace,:replace=>"").sub('','')"\xA1".encode('UTF-8',:undef=>:replace,:invalid=>:replace,:replace=>"").force_encoding('UTF-8').sub('','')"

ruby - 相当于 Iconv.conv ("UTF-8//IGNORE",...) 在 Ruby 1.9.X 中?

我正在从远程源读取数据,偶尔会得到一些采用另一种编码的字符。它们并不重要。我想得到一个“最佳猜测”的utf-8字符串,并忽略无效数据。主要目标是获得一个我可以使用的字符串,并且不会遇到以下错误:Encoding::UndefinedConversionError:从ASCII-8BIT到UTF-8的“\xFF”:utf-8中的无效字节序列 最佳答案 我以为是这样:string.encode("UTF-8",:invalid=>:replace,:undef=>:replace,:replace=>"?")将用“?”替换所有已知项。要

ruby - 为 ruby​​ 1.9 设置全局默认编码

我想告诉ruby​​一切都是utf8,除非另有说明,所以我不必到处放置这些#encoding:utf-8注释。 最佳答案 您可以:将您的RUBYOPT环境变量设置为“-Eutf-8”或使用https://github.com/m-ryan/magic_encoding 关于ruby-为ruby​​1.9设置全局默认编码,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/5908774

Ruby 1.9、YAML 和字符串编码 : how to lead a life of sanity?

在我看来,ruby1.9附带的YAML库是编码失聪的。这意味着在生成YAML时,它将采用任何字节串,并转义任何不输出干净ASCII的字节序列。这很蹩脚,但可以接受。我的问题恰恰相反。从所述YAML转储加载内容时。在下面的示例中,我创建了一个UTF-8字符串,将其转储为!binary类型。当我加载它时,它的编码是ASCII-8BIT。在示例的最后,我尝试将原始字符串和重新加载的字符串与另一个UTF-8字符串连接起来。后者将因Encoding::CompatibilityError而失败。require'yaml's0="Iñtërnâtiônàlizætiøn"y=s0.to_yamls

错误为 "illegal/malformed utf-8"的 Ruby to_json 问题

我在尝试将散列转换为json字符串时遇到错误JSON::GeneratorError:sourcesequenceisillegal/malformedutf-8。我想知道这是否与编码有关,我怎样才能让to_json只按原样对待\xAE?$irb2.0.0-p247:001>require'json'=>true2.0.0-p247:002>a={"description"=>"iPhone\xAE"}=>{"description"=>"iPhone\xAE"}2.0.0-p247:003>a.to_jsonJSON::GeneratorError:sourcesequenceisi

ruby - 将 UTF-8 设置为 Ruby 1.9.3 的默认值

我正在使用Rails4和Ruby1.9.3我经常使用“奇怪”的字符,所以我必须在所有.rb文件的顶部声明UTF-8编码。有没有办法将UTF-8设置为Ruby1.9.3的默认编码?我尝试了所有答案,但是当运行rakedb:seed并创建一个属性包含非US-ASCII有效字符的对象时,我仍然收到此错误:`blockintrace_on':invalidbytesequenceinUS-ASCII(ArgumentError) 最佳答案 要更改源编码(即您实际编写的源代码所在的编码),您目前必须使用魔术注释:#encoding:utf-8

ruby - 如何使用 Sinatra 提供 XML 文档?

我有一些XML文档,我想从Sinatra服务器获取这些文档。我做了一些搜索,但找不到任何具体的东西。我确实找到了构建器gem,但我不想从头开始构建文档。我试着做这样的事情get'/'xml='Myname90'bodyxmlend但这会在它周围添加HTML标签。这可能是我所缺少的非常基本的东西。你能给我指出正确的方向吗? 最佳答案 这对于Sinatra来说非常简单:get'/'docontent_type'text/xml'"Luis99"end在获取“/”时,响应将是XML"Luis99"使用正确的content_type。